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La presente invention est relative a la 
production de proteines d'interet dans des vegetaux, et 
notamment a leur adressage vers le compartiment plastidial. 

Les plastes sont des organites intracellulaires 
des vegetaux chlorophylliens (algues, mousses, et vegetaux 
superieurs). On distingue plusieurs types principaux de 
plastes, selon leur teneur en pigments, et la nature de ceux- 
cx : les amyloplastes, riches en amidon, les chloroplastes 
dans lesquels les pigments principaux sont les chlorophylles 
et les chromoplastes dont les pigments principaux sont des 
carotenoides. Ces trois categories de plastes qui derivent de 
precurseurs communs, les proplastes, ont une structure de 
base commune constitute par une double membrane emprisonnant 
le stroma plastidial. Dans les chloroplastes, il existe un 
troisieme systeme membranaire formant a l'interieur du stroma 
des saccules denommees thylakoide's . 

Outre leur r61e primordial dans la photosynthese, 
les chloroplastes sont egalement impliques dans des reactions 
d'oxydoreduction, par exemple la reduction des nitrites en 
ammonium. Les plastes jouent egalement un role essentiel dans : 
la biosynthese et/ou le stockage de nombreuses molecules, 
parmi lesquelles on citera 1' amidon, les lipides, les 
carotenoides, la plupart des acides amines, des hormones' 
vegetales (acide abscissique, precurseurs des gibberellines, 
du jasmonate, etc.). 

Bien que les plastes possedent leur propre genome 
codant pour une partie de leurs proteines, une grande partie 
des enzymes intervenant dans les differentes fonctions 
plastidiales sont codees par le genome nucleaire et importees 
dans les plastes. 

Cette importation s'effectue par un mecanisme 
specifique, qui a plus particulierement et6 etudie dans le 
cas des chloroplastes (pour revue cf. CHEN et SCHNELL, Trends 
Cell Biol. 9, 222-227, 1999 ; KEEGSTRA et CLINE, The Plant 
Cell 11, 557-570, 1999 ; SCHLEIFF et SOLL, Planta 211, 449- 
456, 2000 ; JACKSON-CONSTAN et KEEGSTRA, Plant Physiol 125 
1567-1676, 2001). Ce mecanisme fait intervenir un systeme 
d' import dans chacune des deux membranes plastidiales : dans 
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la membrane externe, le complexe TOC (Translocon at Outer 
membrane of Chloroplast) qui comprend au moins trois 
proteines : Toe 36, 75 et 34 (KESSLER et al., Science 266, 
1035-1039, 1994 ; PERRY et KEEGSTRA, Plant Cell 6, 93-105, 
5 1994) ; dans la membrane -interne, le complexe TIC (Translocon 
at Inner membrane of Chloroplast) qui comprend au moins 
quatre proteines : Tic 110, 55, 22 et 20 (KESSLER et BLOBEL, 
Proc. Natl, Acad. Sci. 93, 7684-7689, 1996 ; L0BECK et al., 
EMBO J. 15, 4230-4238, 1996 ; CALIEBE et al., EMBO J. 16, 

10 7342-7350, 1997 ; KOURANOV et al., J. Cell Biol., 143, 991- 
1002, 1998), ainsi qu'une proteine chaperonne dans le 
stroma : ClpC (AKITA et al., J. Cell Biol. 136, 983-994, 
1997 ; NIELSEN et al., EMBO J. 16, 935-946, 1997). 

Un element majeur de ce mecanisme est Toc75, qui 

15 est la proteine la plus abondante dans la membrane externe, 
et forme le pore central du canal de translocation situe dans 
cette membrane (SCHNELL et al., Science 266, 1007-1012, 
1994 ; TRANEL et al., EMBO J, 14, 2436-2446, 1995). Toc75 
interagit specif iquement avec une sequence particuliere, 

20 denommee « peptide d' adressage » ou « peptide de transit », 
localisee a l'extremite N-terminale des proteines importees 
dans les plastes (MA et al., J. Cell Biol. 134, 315-327, 
1996) . 

De nombreux peptides d' adressage ont ete 
25 identifies dans les precurseurs des proteines adressees vers 
l'espace intermembranaire, la membrane interne, le stroma, et 
dans le cas des chloroplastes, vers la membrane du 
thylakolde . 

Parmi les proteines connues pour posseder un 
30 peptide d' adressage intraplastidial clivable, on citera 
notamment des proteines adressees a l'espace 

intermembranaire, (Tic22: KOURANOV et al., 1998, precedemment 
cite; KOURANOV et al., J. Biol. Chem. 274, 25181-25194, 
1999) , des proteines adressees a la membrane interne 
35 (TPT (Triose-Pi/Pi translocator ) : BRINK et al., J. Biol. 
Chem. 270, 20808-20815, 1995), des proteines adressees au 
stroma (petite sous-unite de la ribulose-1 , 5-bisphosphate 
carboxylase (Rubisco) : DE CASTRO SILVA FILHO et al . , Plant 



Mol. Biol. 30, 769-780, 1996; anhydrase carbonique) , des 
protemes adressees a la membrane du thylakoide (LHCP (light 
harvesting complex) : LAMP PA et al., J. Biol. Chem. 263 
14996-14999, 1988; Cfo-Il: ATPase subunit) et a la lumiere du 
thylakoide (OEE1 (Oxygen Evolving Element 1) : K 0 et CASHMORE, 
EMBO J. 8, 3187-3194, 1989;. 

Ces peptides d'adressage comprennent generalement 
entre 40 et 100 acides amines, et possedent pour la plupart 
d'entre eux, des caracteristiques communes : il s S ont 
quasiment depourvus d' acides amines charges negativement , 
tels que l'acide aspartique, l'acide glutamique, l'asparagine 
ou la glutamine ; leur region N-terminale est depourvue 
d' acides amines charges, et d' acides amines tels que la 
glycine ou la proline ; leur region centrale contient une 
proportion tres elevee d' acides amines basiques ou 
hydroxyles, tels que la serine et la threonine ; leur region 
C-terminale est riche en arginine et a la capacite de former 
une structure secondaire amphipathique, en feuillet beta. 

Dans le cas des proteines adressees vers la 
lumiere du thylakoide, le peptide d'adressage est bipartite" 
et comprend des informations additionnelles pour traverser la 
membrane du thylakoide (DE BOER et WEISBEEK, Biochim 
Biophys. Acta. 1071, 221-253, 1991). Dans certains cas, ce 
peptide d'adressage bipartite peut aussi etre retrouve chez 
des proteines adressees vers la membrane du thylakoide 
(KARNAUCHOV et al., J. Biol. Chem. 269, 32871-32878, 1994). 

Dans tous les cas le peptide d'adressage est 
clive apres 1' importation. Ce clivage est effectue par des 
proteases specif iques; une protease localisee dans le 
stroma (VANDERVERE et al . , Proc. Natl. Acad. Sci. 92, 7177- 
7181, 1995), et une protease localisee dans la lumiere du 
thylakoide (CHAAL et al., J. Biol. Chem. 273, 689-692, 
1998) ont ete decrites. 

Les proteines adressees a la membrane externe ne 
comportent generalement pas de peptide signal clivable ; 
1' information d'adressage est contenue dans la proteine 
mature (CLINE et HENRY, Annu. Rev. Cell Dev. Biol., 12, 1-26, 
1996) ; apres leur synthese dans le cytosol, ces " proteines 




sent directement incorporees dans la membrane (VAN' T HOF et 
al, FEES lett. 291, 350-354, 1991 et J. Biol- Chem. 268,. 
4037-4042, 1993 ; PINADUWAGE et BRUCE, J. Biol. Chem. 271, 
32907-32915, 1996) par 1' intermediate d' interactions, dont 
5 la nature demeure mal connue, avec la bicouche lipidique. La 
seule exception connue a ce jour concerne la proteine Toc75 
ou (OEP75) dont l'adressage a la membrane externe necessite 
la presence d'un peptide d'adressage W-terminal bipartite 
clivable (TRANEL et al., 1995, precedemment cite; TRANEL and 

10 KEEGSTRA, Plant Cell 8, 2093-2104, 1996). 

II est connu que 1' utilisation des peptides 
d'adressage aux plastes est necessaire pour introduire dans 
ceux-ci des proteines d' interet permettant d'agir sur 
diverses fonctions plastidiales notamment dans le but 

15 d'ameliorer les caracteristiques de plantes d' interet 
agronomique, par exemple la biosynthese des lipides, de 
l'amidon, des vitamines, des hormones ou des proteines par 
lesdites plantes, ou leur resistance aux maladies aux 
insectes ou aux herbicides. Par exemple, la Demande EP 18 9707 

20 propose 1' utilisation de peptides d'adressage clivables issus 
de precurseurs de proteines chloroplastiques, et en 
particulier du peptide d'adressage de la petite sous-unite de 
la ribulose-1, 5-bisphosphate carboxylase, pour importer une 
proteine d' interet dans des chloroplastes ; la Demande PCT 

25 WO 00/12732 propose 1' utilisation de peptides d'adressage de 
differentes proteines plastidiales pour importer des 
proteines d' interet dans des plastes. 

Les fonctions plastidiales pouvant etre modifiees 
de la sorte, et les caracteristiques conferees par ces 

30 modifications sont tres diverses. 

A des fins d' illustration non-limitative, on peut 

citer : 

- 1' augmentation de la resistance aux herbicides, 
par expression du precurseur de 1' acetolactate synthetase 
35 (ALS), (LEE et al. EMBO J., 7, 1241-1248, 1988) 
d' acetolactate synthetase mutee (PRESTON et POWLES, Heredity 
88, 8-13, 2002) ; CHONG et CHOI, Biochem. Biophys. Res. 
Commun. 279, 462-467, 2000), ou de la 3-enolpyruvylshikimate- 
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5-phosphate synthetase (EPSP synthetase) (KLEE et al . , Mol 
Gen. Genet., 210, 437-442, 1987) 

- 1' augmentation de la resistance a different s 
stress, par expression de la zeaxanthine epoxidase, (SEO et 
al., Trends Plant Sci . , 7, 41-48, 2002), de la choline 
monooxygenase (SHEN et al., Sheng Wu Gong Cheng Xue Bao, 17, 
1-6, 2001), du produit du gene ERD1_ARATH (KIYOSUE et al.,' 
Biochem. Biophys. Res. Commun., 15, 196, 1214-1220, 1993), de 
la ferrochelatase (CHOW et al., J. Biol. Chem., 31, 272, 
27565-27571, 1997), de l'omega-3 acide gras desaturase (IBA 
et al., Tanpakushitsu Kakusan Koso, 39, 2803-2813, 1994; 
MURAKAMI et al., Science 21, 287(5452), 476-479, 2000), de la 
glutamine synthetase ( FUENTES et al . , J. Exp. Bot . , 52, 1071- 
1081, 2001) 

15 ~ la modification du metabolisme des plastes, 

pour augmenter la capture d'energie lumineuse, (GAUBIER et 
al., Mol. Gen. Genet., 1, 249, 58-64, 1995), les capacites de 
photosynthese et de croissance, (MIYAGAWA et al., Nature 
Biotech., 19, 965-969, 2001), la teneur en carotenoides 
(HUGCJENEY et al., Eur. J. Biochem., 1, 209, 399-407, 1992 / 
MANN et al., Nature Biotech., 18, 888-892, 2000), ou la 
teneur en differentes substances d'interet, telles que 
l'amidon (Demande PCT WO 00/11144), des acides amines 
essentiels (MUEHLBAUER et al., Plant Physiol., 106, 1303- 
1312, 1994), la provitamine A(R0MER et al . , Nature Biotech., 
18, 666-669, 2000), des hormones ( JO YARD et al . , Plant 
Physiol. 118, 715-723, 1998), etc. 

- la surexpression et l'adressage chloroplastique 
de proteines utilisables a des fins de bioremediation 
(detoxification ou depollution des sols contamines) telles 
que la ferritine, (LOBREAUX et al., Biochem. J., 15, 288 (Pt 
3), 931-939, 1992), les proteines de la famille des 
phytochelatines (CAZALE et CLEMENS, FEBS 507, 215-219, 2001 ; 
TSUJI et al., BBRC 293, 653-659, 2002), etc. 

Tous les peptides d' adressage intraplastidial 
connus dans l' art anterieur permettent d' importer une 
proteine dans les plastes par 1' intermediate des systemes 
membranaires d' import TOC et TIC, comme indique ci-dessus II 



20 



25 



30 



35 



a ete constate que 1 ' utilisation de ces peptides pour 
l'adressage de proteines d' interet dans le chloroplaste 
pouvait, notamment dans les cas ou la construction peptide 
d'adressage/proteine d' interet est placee sous controle d' un 
promoteur fort tel que le promoteur 35S, presenter 
1' inconvenient de saturer ces systemes d' import, en entrant 
en competition avec les proteines adressees naturellement au 
chloroplaste. II en resulte des « fuites » se traduisant au 
bout de quelques jours par la presence de la proteine 
d' interet dans d' autres compartiments subcellulaires comme le 
cytoplasrae . 

II serait souhaitable de disposer de peptides 
d'adressage intraplastidial, qui ne dependraient pas du 
systeme d' import TOC/TIC, et permettraient done d'eviter les 
inconvenients mentionnes ci-dessus. 

Lors de travaux precedents visant a identifier, 
par une approche proteomique, des proteines de preparations 
de membranes de chloroplastes d' epinard, les Inventeurs ont 
identifie, entre autres, des peptides possedant une 
similitude de sequence importante avec une proteine putative 
de 41 kDa d' Arabidopsis (numero d'acces TrEMBL Q9SV68) 
(SEIGNEURIN-BERNY et al . , Plant. J. 19, 217-228, 1999; FERRO 
et al., Electrophoresis 21, 3517-3526, 2000). 

En poursuivant leurs travaux afin de mieux 
caracteriser la proteine d' Arabidopsis, et son homologue chez 
1' epinard, les Inventeurs ont constate que, de maniere 
surprenante, bien qu'il s'agisse de proteines synthetisees 
dans le cytoplasme et importees au niveau de la membrane 
interne du chloroplaste, leur importation s'effectuait sans 
clivage d' un peptide d'adressage ; en outre, 1' analyse de 
sequences de ces proteines ne fait apparaitre aucune sequence 
possedant les caracteristiques des peptides d'adressage 
plastidial connus. 

Les proteines de la famille representee par la 
proteine de 41 kDa d' Arabidopsis f et la proteine homologue 
d' epinard sont designees ci-apres sous la denomination IE41 
(IE pour Inner Envelope selon la nomenclature classiquement 
utilisee pour ce systeme membranaire) . 
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La sequence de la proteine IE41 d' Arabidopsis est 
representee dans la liste de sequences en annexe sous le 
numero SEQ ID NO:l ; la sequence de l'ADNc codant pour la 
proteine IE41 d' epinard est representee dans la liste de 
sequences en annexe sous le numero SEQ ID NO: 2, et la 
sequence polypeptidique correspondante est representee dans 
la liste de sequences en annexe sous le numero SEQ ID NO: 3. 

Les Inventeurs ont recherche quelles etaient les 
regions des proteines IE41 impliquees dans leur adressage 
plastidial, et ont identifie une region de 41 acides amines 
(residus 60 a 100) essentielle a cet adressage. 

La sequence de cette region est representee dans 
la liste de sequences en annexe sous le numero SEQ ID NO: 4 
pour la proteine IE41 d' Arabidopsis, et sous le numero 
15 SEQ ID NO: 5 pour la proteine IE41 d' epinard. 

lis ont en outre 'constate que lorsque des 
fragments d'IE41 contenant cette region etaient fusionnes a 
l'extremite N-terminale d'une proteine heterologue, la 
proteine recombinante resultant de cette fusion etait 
20 adressee aux chloroplastes de maniere. similaire a la proteine 
IE41 entiere. 

La presente invention a pour objet un polypeptide 
d' adressage intraplastidial caracterise en ce qu' il 
comprend : 

25 ~ un domaine A constitue par un polypeptide 

presentant au moins 60%, de preference au moins 70%, 
avantageusement au moins 80%, et de maniere tout a fait 
preferee au moins 90% d'identite, ou au moins 65%, de 
preference au moins 75%, avantageusement au moins 85%, et de 

30 maniere tout a fait preferee au moins 95% de similarity avec 
l'un des polypeptides SEQ ID NO: 4 ou SEQ ID NO: 5 ; 

et au moins un domaine choisi parmi : 
- un domaine B situe a l'extremite N-terminale du 
domaine A, et constitue par un fragment de l'un des 

35 polypeptides SEQ ID NO: 1 0 'u SEQ ID NO: 3 comprenant au 
moins les acides amines 49 a 59, de preference au moins les 
acides amines 39 a 59, avantageusement au moins les acides 
amines 29 a 59, de maniere tout a fait preferee au moins les 
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acides amines 19 a 59, et de maniere particulierement 
avantageuse au moins les acides amines 9 a 59 dudit 
polypeptide, ou bien par un polypeptide presentant au moins 
60%, de preference au moins 70%, avantageusement au moins 
5 80%, et de maniere tout a fait preferee au moins 90% 
d'identite, ou au moins 65%, de preference au moins 75%, 
avantageusement au moins 85%, et de maniere tout a fait 
preferee au moins 95% de similarite, avec ledit fragment ; 

- un domaine C situe a l'extremite C-terminale du 

10 domaine A, et constitue par un fragment de l'un des 
polypeptides SEQ ID NO: 1 ou SEQ ID NO: 3 comprenant au 
moins les acides amines 101 a 111, de preference au moins les 
acides amines 101 a 121, avantageusement au moins les acides 
amines 101 a 131, de maniere tout a fait preferee au moins 

15 les acides amines 101 a 141, et de maniere particulierement 
avantageuse au moins les acides amines 101 a 151 dudit 
polypeptide, ou bien par un polypeptide presentant au moins 
60%, de preference au moins 70%, avantageusement au moins 
80%, et de maniere tout a fait preferee au moins 90% 

20 d'identite, ou au moins 65%, de preference au moins 75%, 
avantageusement au moins 85%, et de maniere tout a fait 
preferee au moins 95% de similarite, avec ledit fragment. 

Les pourcentages d'identite ou de similarite 
mentionnes ici sont determines a 1' aide du logiciel BLASTp 

25 (ALTSCHUL et al., Nucleic Acids Res. 25, 3389-3402, 1997), en 
utilisant les parametres par defaut. 

Les domaines A, B, et/ou C definis ci-dessus 
peuvent provenir d'une meme proteine IE41 ; ils peuvent 
egalement provenir de proteines IE41 d'origines differentes. 

30 La presente invention a egalement pour objet tout 

polypeptide chimerique resultant de la fusion d'un 
polypeptide d'adressage intraplastidial conforme a 
1' invention avec un polypeptide heterologue. Ledit 
polypeptide heterologue peut etre n' importe quel polypeptide 

35 d'interet que l'on souhaite introduire dans les plastes. De 
preference, le polypeptide d'adressage intraplastidial 
conforme a 1 « invention est place a l'extremite N-terminale du 
peptide heterologue. II pourrait toutefois etre egalement 



place a 1'interieur de celui-ci, ou bien a son extremite C- 
terminale . 

La presente invention a egalement pour objet 
1' utilisation d'un polypeptide d'adressage intra-plastidial 
conf orme a 1 ' invention . pour 1' importation d'une proteine 
d'interet dans des plastes, et avantageusement , pour 
l'adressage de ladite proteine a la membrane interne 
plastidiale. 

Selon un mode de mise en oeuvre prefere de la 
presente invention, ledit polypeptide d'adressage intra- 
plastidial est utilise pour 1' importation de ladite proteine 
d'interet dans des chloroplastes . 

En particulier, la presente invention a pour 
objet un procede pour importer une proteine d'interet dans 
des plastes caracterise en ce qu'il comprend 1' expression, 
dans une cellule vegetale contenant lesdits plastes, d'un 
polypeptide chimerique resultant de la fusion d'un 
polypeptide d'adressage intraplastidial conforme a 
1' invention avec un polypeptide heterologue. 

La presente invention a egalement pour objet : 

- tout polynucleotide codant pour un polypeptide 
d'adressage intraplastidial ou pour un polypeptide chimerique 
conforme a 1 ' invention ; 

toute cassette d' expression recombinante 
comprenant un polynucleotide ' conforme a 1' invention place 
sous contrdle de sequences appropriees de regulation de la 
transcription (notamment promoteur et terminateur de 
transcription) . 

tout vecteur recombinant resultant de 
1' insertion, dans un vecteur-h6te approprie, d'un 
polynucleotide ou d'une cassette d' expression conforme a 
1 ' invention. 

La presente invention a aussi pour objet des 
cellules-hdtes hebergeant un polynucleotide, une cassette 
d' expression, ou un vecteur recombinant conforme a 
1 1 invention . 

La presente invention englobe egalement des 
plantes transgeniques genetiquement transformees par un 
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polynucleotide ou une cassette d' expression conforme a 
1' invention, ainsi que les descendants de ces plantes. 
L' invention comprend egalement les cellules et tissus 
vegetaux, ainsi que les organes ou parties de plantes, y 
compris feuilles, tiges, racines, fleurs, fruits, et/ou 
graines obtenues a partir de ces plantes. 

Les techniques classiques de construction de 
vecteurs recombinants, de transformation de cellules ou 
d'organismes hote, et de production de proteines 
recombinantes, sont utilisables pour la mise en oeuvre de la 
presente invention. 

Le choix du vecteur-hdte, et des sequences de 
regulation de 1' expression seront effectuees notamment en 
fonction de la methode de transformation et de la plante hote 
15 choisies, et/ou du type de cellule ou de tissu dans lequel on 
souhaite obtenir 1' expression . 

De tres nombreux promoteurs utilisables pour 
1' expression dans des cellules vegetales sont connus en eux- 
memes. A titre d' exemples, on peut choisir un promoteur 
20 constitutif, tel que le promoteur 35S du CaMV ou ses derives, 
ou le promoteur de l'actine ou de 1' ubiquitine, etc. On peut 
egalement choisir un promoteur inductible ou bien un 
promoteur tissu-specif ique, afin de n'effectuer 1'adressage 
plastidial de la proteine d' interet qu'a certains stades du 
25 developpement de la plante, dans certaines conditions 
environnementales, ou dans certains tissus-cibles . 

Par exemple, si 1'on souhaite obtenir 
pref erentiellement un adressage de la proteine d' interet vers 
les chloroplastes, on exprimera un polypeptide chimerique 
30 conforme a 1' invention sous controle d'un promoteur 
specifique de tissus ou organes riches en plastes. A titre 
d' exemples, les promoteurs du virus de la Chlorelle regulant 
1' expression du gene de 1' adenine methyltransf erase (MITRA et 
HIGGINS, Plant Mol. Biol. 26, 85-93, 1994) ou celui du virus 
35 de la mosalque du manioc (VERDAGUER et al., Plant Mol. Biol. 
37, 1055-1067, 1998) s'expriment principalement dans les 
tissus verts. Les elements regulateurs du promoteur du gene 
2A11 de la tomate permettent une expression specifique dans 
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les fruits (VAN HAAREN et HOUCK, Plant Mol . Biol. 17, 615- 
630, 1991), etc. 

Des methodes de transformation de cellules 
vegetales ou de plantes entieres sont bien connues en elles- 
memes : a titre d' exemples non-limitatif s, on citera la 
transformation de protoplastes^ en presence de 
polyethyleneglycol, 1' electroporation, 1' utilisation d' un 
canon a particules, la micro-injection cytoplasmique ou 
nuclearre, ou la transformation par 1' intermediate 
d' Agroba cteri urn. 

La presente invention peut etre mise en ceuvre 
dans les applications usuelles des peptides d'adressage aux 
plastes, et notamment dans celles mentionnees plus haut, pour 
agir sur di verses fonctions plastidiales . II s'agit, en 
particulier, de la modification de fonctions propres a la 
membrane interne de l'enveloppe, par exemple, les 
biosyntheses de pigments, de quinones, d'acides gras, de 
vitamines et de precurseurs d' hormones vegetales, mais aussi, 
1' import de tous les ions et metabolites vers le plaste. 

Les caracteristiques des peptides d'adressage 
plastidial conformes a 1' invention, qui sont tres differentes 
de celles des peptides d'adressage plastidial connus 
permettent de supposer que les peptides d'adressage conformes 
a 1' invention utilisent un systeme d' import different de 
celui impliquant les proteines TOC et TIC. 

De ce fait, les proteines d' interet adressees aux 
plastes a 1'aide d'un peptide d'adressage conforme a 
1' invention n' entreraient pas en competition avec les 
proteines naturellement adressees vers le plaste par 
1' intermediate du systeme TOC et TIC, et ne satureraient pas 
ce dernier. Ceci permettrait notamment d' eviter les fuites 
dans les autres compartiments subcellulars, et de conserver 
les proteines d' interet dans le chloroplaste, meme apres 
Plusieurs jours d'expression. Ceci permettrait egalement 
d'adresser vers les plastes des proteines pour lesquelles 
1' import classique grace a une sequence d'adressage clivable 
en N-terminal et utilisant le systeme TIC/TOC, ne serait pas 
fonctionnel. 
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La presente invention sera mieux comprise a 
l'aide du complement de description qui va suivre, qui se 
refere a des exemples non-limitatif s illustrant l'obtention 
et la caracterisation de peptides d'adressage plastidial 
5 con formes a 1' invention et leur mise en ceuvre pour 
1' importation de proteines heterologues dans les 
chloroplastes . 

EXEMPLE 1 : CARACTERISATION ET CLONAGE DE LA PROTEINE IE41 
D' ARABIDOPSIS THALIANA 

10 Lors de travaux anterieurs visant a identifier 

les proteines les plus hydrophobes de preparations de 
membranes chloroplastiques d' epinard ( SEIGNEUR IN-BERNY et 
al. f Plant. J. , 19, p. 217-228, 1999 ; FERRO et al., 
Electrophoresis, 21, 3517-3526, 2000), plusieurs peptides 

15 derivant d f une proteine de 41, kDa presentant une forte 
similarity de sequence avec une proteine putative 
d' Arabidopsis (Numero d' accession TrEMBL Q9SV68) ont ete mis 
en evidence. 

Cependant, 1' analyse de la sequence primaire de 
20 cette proteine de 41 kDa a l'aide du programme TMPred 
(HOFMANN et STOFFEL, Biol. Chem. Hoppe-Seyler . , 347, 166, 
1993), n'a pas permis de detecter de segments trans- 
membranaires pouvant assurer l'ancrage de la proteine dans 
une bicouche lipidique. 
25 Pour confirmer la localisation de cette proteine 

dans l'enveloppe du chloroplaste, l'ADNc correspondant a ete 
clone et la proteine recombinante sur-exprimee chez E. coli 
afin d'obtenir des anticorps polyclonaux diriges contre cette 
proteine - 

30 Expression chez E. call 

L'ADNc codant pour la proteine de 41 kDa 
d' Arabidopsis est obtenu par PCR, a partir d'une librairie 
d'ADLMc d' Arabidopsis, en utilisant les amorces suivantes : 

TCA CATATGG CTGGAAAACTCAATGCAC (SEQ ID NO : 10) 
35 permet d' introduire un site de restriction 

Mdel (souligne) a l'extr^mite 5' de 1' ADNc ; 

ATG GATCCA ACGCTCTTATGGCTCGAC (SEQ ID NO : 11) 
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qui permet d' introduire un site de restriction 
BamHI (souligne) a l'extremite 3' de l'ADNc. 

Le fragment d' amplification est clone dans le 
plasmide pBluescript KS". L' insert est ensuite digere par les 
5 enzymes de restriction Ndel et BamHI, et insere dans le 
vecteur d' expression pET-15b (NOVAGEN) . 

Le vecteur resultant permet 1' expression d'une 
proteine recombinante ayant une extension polyhistidine (His- 
tag) a son extremite N-terminale [ (His-tag) -P41J . 
10 Ce vecteur est utilise pour transformer des 

bacteries E. coli, souche BLR (DE3) . 

Les bacteries recombinantes sont mises en culture 
dans 500 ml de milieu LB contenant 100 ug/ml d' ampicilline a 
37°C. Quand la densite optique a 600 nm (DO 600 ) de la culture 
15 d'E. coli atteint 0,6, on ajoute de l'IPTG (isopropyl-p-D- 
galactothiopyranoside) a une concentration finale de 1 mM, 
pour induire 1' expression de la proteine de 41 kDa. 

Apres 3 heures de culture, les cellules sont . 
centrifugees pendant 2 mn a 13 000 rpm (EPPENDORF 5415D) . 

Le culot est remis en suspension dans 20 ml de 
tampon de lyse (50 mM NaH 2 P0 4 , 300 mM Na CI, 10 mM imidazole, * 
pH 8) et les bacteries sont lysees par sonication (sonicateur . 
OMRON, type STP. YM. 220 . VAC, 6x1 mn, 0°C) . 

Apres sonication, l'extrait proteique total est 
25 analyse par SDS-PAGE 12%. Les gels sont colores au bleu de 
Coomassie (R-250, BIORAD) . 

Les resultats sont illustres par la figure 1A : 
Legende de la figure 1A : 

pET-15b = bacteries transformees par le plasmide non 
30 recombinant (contrdle negatif) 

P ET-15b + insert = bacteries transformees par le plasmide 
recombinant 

- = pas d' induction par IPTG 
+ = induction par IPTG 
35 * = bande correspondant a la proteine de 41 kDa recombinante 

Apres induction par l'IPTG, la proteine 
recombinante est fortement exprimee dans les bacteries 
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transformers par le plasmide pET-15b comprenant 1' insert 
d'ADNc <i' Arabidopsis. 

Solubilisation de la proteiae recombinante 

Le culot bacterien est mis en suspension dans 
5 1 ml de tampon Tris/HCl 20 mM, pH 6,8 puis lyse par 
sonication (sonicateur OMRON , type STP. YM. 220 . VAC, 6x1 mn, 
0°C) . 

Apres sonication, une premiere centrif ugation 
(2 mn, 13 000 rpm) de I'extrait proteique total permet 

10 d' isoler les proteines solubles du surnageant . Les proteines 
insolubles du culot sont mises en suspension dans 1 ml d' un 
tampon contenant du detergent (20 mM Tris/HCl pH 6,8, 0,5% 
Triton X-100). Une seconde centrif ugation permet d' isoler les 
proteines membranaires solubilisees par le Triton X-100. Les 

15 proteines non solubilisees sont , remises en suspension dans 
20 mM Tris/HCl, pH 6,8 et analysees . Les differentes 
fractions sont analysees par SDS-PAGE 12%, comme indique ci- 
dessus . 

Les resultats sont illustres par la figure IB : 
20 Legende de la figure IB : 

pET-15b « bacteries transformees par le plasmide non 
recombinant (controle negatif) 

pET-15b + insert = bacteries transformees par le plasmide 
recombinant 

25 S = proteines solubles 

D = proteines solubilisees dans le Triton X-100 
I = proteines non solubilisees dans le Triton X-100 
* = bande correspondant a la proteine de 41 kDa recombinante 
On note que la proteine recombinante (*) se 

30 retrouve dans 2 fractions distinctes : une fraction 
hydrosoluble presente dans le cytosol d'E. coli et une 
fraction insoluble, qui n'est pas solubilisee par le Triton 
X-100, ce qui indique qu'elle est probablement agregee sous 
forme de corps d' inclusion. 

35 Purification de la proteine recombinante 

La fraction soluble de la proteine (His-tag) -P41 
recombinante est purifiee par chromatographie d'af finite. 
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Apres centrifugation (10 ran a 6 000 rpm, 
EPPENDORF 5415D), le surnageant est depose sur une colonne 
d'af finite « His-bind resin », (NOVAGEN) de 2,5 ml chargee 
avec 13 ml de tampon de charge (50 mM NiS0 4 ) et equilibree 
par 5 ml de tampon d' equilibrage (20 mM Tris/HCl pH 7,9, 5 mM 
imidazole, 0,5 M NaCl) . 

La colonne est lavee avec 2 volumes contenant 
35 mM imidazole, et 2 volumes de tampon de lyse contenant 
60 mM imidazole (L2) . La proteine est eluee avec 6 volumes de 
tampon de lyse contenant 250 mM imidazole. Les differentes 
fractions sont analysees par SDS-PAGE 12% et revelees au bleu 
de Coomassie. 

Les resultats sont illustres par la figure 2. 
Legende de la figure 2 : 

C = culot bacterien dilue dans le tampon de lyse (10 ul) 
S = proteines bacteriennes solubles (10 ul) 
P = proteines non fixees (10 u.1) 

L, LI, L2 = lavages avec le tampon de lyse (35 et 60 mM 
imidazole) (15 ul) 

Elution = fraction eluee en presence de 250 mM imidazole. 
Production d' anticorps polyclonaux 

La proteine recombinante (His_tag) -P41 purifiee, 
est dessalee (colonne SEPHADEX G25) et stockee a -80°C. 

Cette proteine recombinante est utilisee pour 
immuniser des lapins afin de produire des anticorps 
polyclonaux diriges contre la proteine de 41 kDa 
d' Arabidopsis . 

EXEMPLE 2 : LOCALISATION DE LA PROTEINE DE 41 KDA DANS LES 
CHLOROPLASTES 

Lors de la procedure de purification, la proteine 
de 41 kDa se comporte comme une proteine hydrosoluble et 
faiblement hydrophobe, ce qui pose la question de son 
association effective avec l'enveloppe du chloroplaste . 

Sa localisation sub-cellulaire a done ete 
verifiee par analyse de differentes fractions 
chloroplastiques . 

Des chloroplastes bruts sont obtenus a partir de 
3-4 kg de feuilles d'epinard (Spinacia oleracea L.) et'sont 
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purifies par centrif ugation isopycnique sur gradient de 
Percoll (DOUCE et JO YARD, Methods in chloroplast Molecular 
Biology. Edelman, M. , Hallick, R. and Chua, N.-H., eds. 
(Amsterdam : Elsevier Science Publishers BV) , 239-256, 1982). 
A ce stade, des inhibiteurs de proteases (1 mM PMSF, 1 mM 
benzamidine et 0,5 mM acide amino caproique) sont ajoutes 
afin d'empecher toute degradation proteique. Les 
chloroplastes purifies sont lyses dans un milieu hypotonique, 
et les membranes de l'enveloppe sont purifiees a partir du 
lysat par centrif ugation sur gradient de sucrose (DOUCE ET 
JOYARD, 1982, precite) . Des sous-fractions d'enveloppe 
respectivement enrichies en membranes externes et internes 
sont obtenues selon le protocole decrit par BLOCK et al . (J. 
Biol. Chem., 258, 13273-13280, 1983). 
15 Toutes les etapes ci-dessus sont realisees entre 

0 et 5°C. Les fractions obtenues sont stockees en azote 
liquide dans 50 mM MOPS-NaOH, pH 7,8, en presence 
d' inhibiteurs de proteases (1 mM benzamidine et 0,5 mM acide 
amino caproique) . 
20 Analyse des fractions chloroplastiepies 

Les analyses par SDS-PAGE des chloroplastes 
totaux, ou de leurs fractions membranes d'enveloppe, stroma, 
membranes des thylakoldes ; 15 ug) ainsi que des des sous- 
fractions d'enveloppe de chloroplastes (15 jug) sont 
25 effectuees come decrit par CHUA (Methods Enzymol., 69, 434- 
436, 1980) . Les gels de resolution et de concentration (12- 
15% acrylaraide) , comme le tampon de migration, contiennent 
0,1% de SDS. Les peptides sont reveles soit par le bleu de 
Coomassie (MANIATIS et al., Cold Spring Harbor Laboratory, 
Cold Spring Harbor, NY, 1982) soit par le nitrate d' argent 
(MERRIL et al., Anal. Biochem. , 110, 201-207, 1981). 

Pour les analyses par Western blot, la proteine 
de 41 k.Da est detectee en utilisant les anticorps polyclonaux 
diriges contre la proteine recombinante d' Arabidopsis 
35 produite comme decrit a l'exemple 1, marques a la phosphatase 
alcaline . 

Les resultats sont representes sur la figure 3A. 
Legende de la figure 3A : 
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C - proteines du chloroplaste 
E = proteines des membranes d' enveloppe 
S = proteines du stroma 

T = proteines des membranes des thylakoldes 

Ces resultats montrent que la proteine de 41 kDa 
est associee uniquement avec 1' enveloppe du chloroplaste et 
n'est pas detectee dans le stroma ni dans les thylakoldes. 

Les chloroplastes intacts purifies sont depourvus 
de proteines du cytosol qui peuvent contaminer la preparation 
(DOUCE et JO YARD, 1980, precite) . Toutefois, la proteine de 
41 kDa pourrait interagir specif iquement avec la membrane 
externe de 1' enveloppe du chloroplaste et pourrait ainsi etre 
co-purifiee avec les preparations d' enveloppe. Afin d'exclure 
cette possibility 20 ug d' enveloppe issue de chloroplastes 
15 intacts sont traites avec la thermolysine de Bacillus 
thermoproteolyticus (0, 20, 50 et 100 ug/ml) afin de digerer 
les polypeptides localises sur la face externe de la membrane 
externe de 1' enveloppe (JOYARD et al . , J. Biol. Chem., 258, 
10000-10006, 1983). A titre de controle, des proteines 
20 d' enveloppe solubilisees subissent le meme traitement 
proteolytique . 

La presence de la proteine de 41 kDa est detectee 
par Western blot, comme decrit ci-dessus. 

Les resultats sont representes dans les figures 

25 3B et 3C. 

Legende des figures 3B et 3C : 
0 = absence de thermolysine 
20 = thermolysine a 20 ug/ml 
50 = thermolysine a 50 ug/ml 
100 = thermolysine a 100 ug/ml 

La proteine de 41 kDa n' est pas affectee par le 
traitement par la thermolysine (figure 3B) , alors que le meme 
traitement proteolytique realise sur des proteines 
d' enveloppe solubilisees montrent la sensibilite de la 
proteine de 41 kDa au traitement par la thermolysine (figure 
3C). ce resultat exclut l'hypothese selon laquelle la 
proteine de 41 kDa serait localisee sur la face externe de la 
membrane externe. De fait, la proteine de 41 kDa n'est pas 
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une proteine du cytosol contaminant les preparations 
d'enveloppe de chloroplaste. 

Des sous-fractions d'enveloppe respectivement 
enrichies en membranes externes et internes sont utilisees 
5 pour preciser la sous-localisation de la proteine de 41 kDa 
au niveau de la membrane de l'enveloppe du chloroplaste. La 
nature de ces sous-fractions d'enveloppe a ete confirmee par 
1' utilisation des marqueurs IE18 et OEP24, qui sont 
respectivement des proteines intrinseques de la membrane 
10 interne et externe de l'enveloppe du chloroplaste. Les 
proteines IE18 et OEP24 sont detectees en utilisant des 
anticorps polyclonaux diriges specif iquement contre chacune 
de ces proteines. 

Les resultats sont representees dans la figure 3D. 
15 Legende de la figure 3D : 

E = proteines des membranes de l'enveloppe 

OM == proteines de la membrane externe 

IM = proteines de la membrane interne 

La proteine de 41 kDa se retrouve, comrae la 
20 proteine IE18, uniquement dans les preparations d' enveloppes 

chloroplastiques enrichies en membrane interne. 

L' ensemble des resultats representes dans les 

figures 3A-3D montre que la proteine de 41 kDa est localisee 

au niveau de la membrane interne de l'enveloppe du 
25 chloroplaste. 

D' apres la nomenclature classique, cette proteine 

de l'enveloppe interne, presentant une masse theorique en 

electrophorese sur gel de polyacrylamide, de 41 kDa, est 

denommee IE41 (pour « Inner Envelope Protein of 41 kDa ») . 
30 Analyse cies interactions entre la proteine IE41 et la 

membrane interne de l / enveloppe du chloroplaste 

Pour analyser plus precisement le mode 

d' interaction de la proteine IE41 avec la membrane interne 

des chloroplastes, differentes hypotheses ont ete testees : 
35 1) La proteine IE41 serait une proteine soluble 

localisee dans l'espace intermembranaire situe entre les 

membranes externe et interne de l'enveloppe du chloroplaste. 

Cette proteine serait co-purifiee avec les preparations 
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d'enveloppe, et sequestree dans les vesicules d'enveloppe. 
Dans ce cas la sonication des vesicules d'enveloppe 
permettrait la liberation de IE41. 

Pour tester cette premiere hypothese, des 
proteines d'enveloppe (500 ug) sont solubilisees dans 50 mM 
MOPS, P H 7,8 (500 ul). Les vesicules d'enveloppe sont 
soniquees pendant 10 sec puis centrifugees (20 mn a 72 000 g, 
Beckman L2 65B, rotor SW28) afin de separer les proteines 
solubles et membranaires . Chaque fraction (20 ul) est 
analysee par SDS-PAGE 12% (revelation : bleu de Coomassie) et 
Western blot. 

Les resultats sont representes dans la figure 4A. 
Legende de la figure 4A : 
- = pas de sonication 
+ = sonication 
S = proteines solubles 
I = proteines de membrane 

Les analyses par SDS-PAGE et Western blot des 
fractions d'enveloppe traitees montrent que la proteine IE41 
n'est pas solubilisee apres sonication des vesicules 
d'enveloppe. Au contraire, les proteines majeures solubles du 
stroma (RbcL) qui sont sequestrees dans les vesicules 
d'enveloppe, et qui sont connues pour contaminer les 
fractions d'enveloppe, sont solubilisees par ce traitement. 
Ceci montre que la proteine IE41 n'est ni une proteine 
soluble de l'espace intermembranaire, ni une proteine soluble 
du stroma contaminant la fraction d'enveloppe purifiee. 

2) La proteine IE41 peut etre liee a la membrane 

interne : 

par ancrage a la bicouche lipidique ou 
insertion partielle dans celle-ci ; dans ce cas, seule 
1' utilisation de detergent peut permettre la solubilisation 
de la proteine IE41 ; 

- par des interactions electrostatiques avec une 
ou plusieurs proteines membranaires ou la surface polaire de 
la bicouche lipidique dans ce cas, ces interactions peuvent 
etre rompues, et la proteine IE41 solubilisee, par un 
traitement alcalin ou par de fortes concentrations salines. 
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Pour determiner le type d' interactions impliquees 
dans la liaison de IE41 avec la membrane interne, les 
experimentations suivantes ont ete effectuees : 

a) solubilisation par le Triton X-100 : 
Des vesicules d' enveloppe (0,8 mg) sont diluees 
dans 1 ml de 50 mM MOPS, pH 7,8 contenant 0,05, 0,1 ou 0,2% 
(v/v) de Triton X-100. Apres incubation pendant 30 mn a 4°C, 
le melange est centrifuge pour separer les proteines solubles 
et membranaires. Toutes les fractions (20 ul) sont analysees 
par SDS-PAGE 12% (revelation : bleu de Coomassie) et Western 
blot . 

Les resultats sont illustres par la figure 4C. 
Legende de la figure 4C : 
Mix = vesicules d' enveloppe purif iees 
M = proteines membranaires d' enveloppe 
S = proteines solubles d' enveloppe 

Ces resultats montrent que la proteine IE41 peut 
etre totalement solubilisee par des concentrations de Triton 
X-100 (0,2%), beaucoup plus faibles que celles (de l'ordre de 
2%) qui sont necessaires pour solubiliser les proteines 
intrinseques . 

b) solubilisation par traitement alcalin ou par 
traitement salin. 

Des vesicules d' enveloppe purif iees (500 |tig) sont 
incubees 30 mn a 4°C dans differents milieux (500 fil) : 

1) 10 mM MOPS, pH 7,8 + 0,5 M NaCl ; 

2) 10 mM MOPS, pH 7,8 + 0,5 M KI ; 

3) 0,1 M Na 2 C0 3 , pH 11 ; 

4) 0,1 N NaOH, 

puis soniquees et centrifugees comme decrit ci- 
dessus afin de separer les proteines solubles et 
membranaires . 

Toutes les fractions sont analysees (20 |ul) par 
SDS-PAGE 12% (revelation : bleu de Coomassie) et Western blot 
(detection avec les anticorps polyclonaux diriges contre la 
proteine IE41 d' Arabidopsis (dilution 1/5 000) ou diriges 
contre la proteine IE18 (dilution 1/5 000) . 

Les resultats sont representee dans la figure 4B 
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Legende de la figure 4B : 

+ = sonication (10 sec) 

NaCl 0,5 M « traitement 1 

KI 0,5 M « traitement 2 
5 0,1 M Na 2 C0 3 , pH 11 = traitement 3 

0,1 N NaOH = traitement 4 

S = fraction de proteines solubles 

I = fraction de proteines insolubles 

Ces resultats montrent que la proteine IE41 est 
10 au moins en partie solubilisee par les traitements salins 

(KI, NaCl) ou alcalins moderes (Na 2 C0 3 ) , qui sont sans effet 

sur la proteine intrinseque IE18, cette derniere ne pouvant 

etre solubilisee que par un traitement alcalin fort (NaOH) . 

L' ensemble des resultats presentes dans les 
15 figures 4A, 4B et 4C indiquent que la proteine IE41 est une" 

proteine extrinseque dont la liaison k la membrane interne de 

l'enveloppe chloroplastique implique des interactions 

electrostatiques . 

EXEMPLE 3 : PURIFICATION ET GARACTERI SAT I ON DE IA PROTEINE 
20 IE41 D' EPINARD 

De fagon surprenante, la proteine 1E41 purifiee a 
partir de chloroplastes d' epinard et la proteine recombinante 
d' Arabidopsis presentent une taille similaire en SDS-PAGE et 
Western blot, ce qui evoque la possibilite que IE41 puisse 

25 etre adressee a la membrane interne de l'enveloppe sans 
necessiter le clivage d'une sequence d' import N-terminale. 

Pour tester cette hypothese, la proteine IE41 
presente dans l'enveloppe des chloroplastes d'epinards a ete 
purifiee afin de la sequencer et de comparer sa sequence a 

30 celle de 1'ADNc correspondant . 

Immunoptirification de la proteine IE41 d' epinard 

Des proteines d' enveloppe chloroplastique (1 mg) 
sont solubilisees dans 1 ml de tampon Tris/HCl 50 mM, NaCl 
150 mM, CHAPS 6 mM et centrifugees (20 mn, 72 000 g, Beckman 
35 L2 65B, rotor SW28) . Les proteines solubles sont incubees 
pendant 1 h a 4°C avec 33 |nl de serum polyclonal dirige 
contre la proteine recombinante IE41 d' Arabidopsis. • On ajoute 
alors 50 \.ig d' agarose-proteine A (BOEHRINGER) et le melange 
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est incube 3 h a 4°C. Apres 3 lavages successifs par 
centrifugation (EPPENDORF 5415D, 12 000 rpm, 20 ran, 4°C) et 
remise en suspension du culot dans 1 ml de tampon de 
solubilisation (20 mM MOPS, 150 mM NaCl, 6 mM CHAPS, pH 7,8), 
on ajoute un exces (50 ug) de proteine recombinante (His- 
tag)-IE41 dans 200 ul de tampon de solubilisation. Le melange 
est incube pendant 1 h a 4°C, et centrifuge pendant 20 mn a 
12 000 rpm (EPPENDORF 5415D) . Le surnageant est incube 
pendant 1 h avec de la resine Ni-NTA (QIAGEN) , precedemment 
equilibree dans le tampon de solubilisation, afin d'eliminer 
la majeure partie de la proteine recombinante (His-tag) -IE41 . 

Chaque fraction (20 ul) est analysee par SDS-PAGE 
12% (revelation au nitrate d' argent) et Western blot (en 
utilisant les anticorps polyclonaux de lapin anti-lE41 
decrits A l'Exemple 1). 

Les resultats sont representes dans la figure 5. 
Legende de la figure 5 : 
A : analyse par SDS-PAGE ; 
B : Western blot ; 

Mix = proteines d'enveloppe solubilisees ; 
C = proteines insolubles ; 
S = proteine solubles ; 

LI, L2, L3 - fractions recuperees au cours des 3 lavages 
successifs ; 

El = fraction eliminee par incubation avec la resine Ni-NTA; 
E2 = proteine IE41 d' epinard purifiee (So) + (His-tag) -IE41 . 

La fraction E2 comprenant la proteine IE41 
naturelle d' epinard purifiee (So) demeure contaminee par la 
proteine (His-tag) -IE41 recombinante d' Arabidopsis . 

La difference de taille entre ces deux proteines 
correspond a 1' extension polyhistidine (His-tag) presente a 
1'extremite N-terminale de la proteine recombinante. 

EXEMPLE 4 : OBTENTION DE L'ADNc CODANT POUR LA PROTEINE IE41 
D' EPINARD. 

Le sequencage partiel de la proteine IE41 
d' epinard eluee a partir du gel d' electrophorese a permis 
d'obtenir 9 sequences peptidiques differentes. Ces sequences 



ont ete utilisees pour definir des amorces degenerees qui ont 
permis d' isoler l'ADNc codant pour la proteine IE41. 

La sequence complete de cet ADNc (SEQ ID NO: 2), 
ainsi que la sequence polypeptidique deduite (SEQ ID NO: 3) 
sont representees sur la- figure 6. Le codon ATG d' initiation 
de la traduction est indique en caracteres gras, et le codon 
stop TAA est souligne. Les 9 sequences peptidiques obtenues 
par sequencage direct de la proteine IE41 d'epinard sont 
surlignees en gris . La correspondance entre les peptides 
obtenus avec la sequence deduite de l'ADNc de la proteine 
IE41 d'epinard, en particulier au niveau de la region N- 
terminale, ainsi que la presence d'un codon stop en aval de 
la methionine initiatrice et dans le meme cadre de lecture, 
demontrent que l'ADNc predit est complet et que cette 
proteine ne subit pas de maturation post-traductionnelle lors 
de son adressage a la membrane interne de l'enveloppe du. 
chloroplaste 

La proteine IE41 d'epinard presente 75,1% 
d'identite et 88,8% de similarity avec la proteine IE41. 
' d' Arabidopsis. Cette forte similarity, et le fait 
qu' Arabidopsis contient seulement un gene ie41 par genome 
haploide, permettent de conclure que ces proteines sont 
codees par des genes d' Arabidopsis et d'epinard orthologues. ; 

Les proteines IE41 d' Arabidopsis et d'epinard ont 
ete alignees avec des proteines homologues de bacterie, de 
levure, et d'animaux. 

Les resultats sont presentes sur la figure 7. 
Arabidopsis thaliana : IE41 ATH (SEQ ID NO : 1), 
Epinard : IE41 SOL (SEQ ID NO : 3) ; 

proteines homologues : 
Esherichia coli : QORECOLI (SEQ ID NO : 6) , 
Saccharomyces cerevisiae : QOR YEAST (SEQ ID NO : 7), 
Cavia Porcellus : QORCAVPO (SEQ ID NO : 8), 
souris : QORMOUSE (SEQ ID NO : 9) . 

Les residus conserves dans les 6 sequences peptidiques sont 
surlignes en gris fonce. Les residus conserves dans la 
sequence de IE41 et dans au moins une autre sequence de 
proteine homologue sont surlignes en gris c'lair.. Les 



similarities entre residus se basent sur les groupes 
suivants : ASPTG, ILMV, KRH, NQ, DE, YWF et C. 

Les recherches d' homologies indiquent que la 
proteine IE41 appartient a la super famille des 
5 deshydrogenases, et plus part iculierement au groupe des 
quinones oxydo-reductases de type ^-crystalline (JORNVALL et 
al., FEBS 3, 240-244, 1993), De plus, la comparaison de 
sequence entre les proteines IE41 et les autres proteines de 
la meme famille, revele que les 50 premiers residus dans la 

10 region N-terminale de ces proteines sont tres conserves entre 
bacteries, vegetaux, et animaux. Cette observation suggere 
que cette region N-terminale des proteines IE41 de vegetaux 
ne serait pas impliquee dans l'adressage dans le 
chloroplaste, et serait conservee plus probablement du fait 

15 de la pression de selection exercee au cours de devolution 
sur le domaine catalytique de la proteine. 

EXEMPLE 5 : ANALYSE DE L'ADBESSAGE PLASTIDIAL DE LA PROTEINE 
IE41 D ' ARABIDOPSIS DANS DES CELLULES D ' ARABIDOPSIS ET DE 
TABAC 

20 Pour definir le domaine essentiel a 1' import de 

la proteine IE41, differentes constructions codant pour des 
formes tronquees de cette proteine fusionnees k la GFP sont 
exprimees dans les cellules d' Arabidopsis et de tabac. 
Construction des vecteurs d f expression : 

25 plasmide [ 35Q-sGFP (S65T) ] utilise pour ces 

constructions, qui comprend la sequence codant pour la GFP 
sous controle du promoteur 35S, ainsi que le plasmide [35Q- 
TP-sGFP (S65T) ] , qui comprend la sequence codant pour le 
peptide d'adressage (TP) de la petite sous-unite de la 

30 ribulose-1, 5-bisphosphate carboxylase, fusionnee a la 
sequence codant pour la GFP ont ete decrits precedemment par 
CHID et al. (Curr. Biol., 6, 325-330, 1996). 

La sequence codant pour la proteine IE41 
d' Arabidopsis est amplifiee par PCR en utilisant les deux 

35 amorces suivantes : 

XhoI-N-tar CCT CTCGAGA TGGCTGGAAAACTCATGCAC (SEQ ID NO : 12), 
et 

NcoI-C-ter CAAC CCATGGA TGGCTCGACAATGATCTTC (SEQ ID NO : 13), 




qui introduisent respectivement un site Xhol et un site Ncol 
(soulignes) . 

Le produit de PCR est clone a bouts francs dans 
le vecteur PBLUESCRIPT KS (STRATAGENE) . Le fragment Xhol-Ncol 
5 clive du plasmide ainsi . obtenu est insere dans le plasmide 
35Q-sGFP(S65T) prealablement digere par Sall-Ncol afin de 
creer le vecteur 35Q-IE41-SGFP (S65T) , comprenant la region 
codante de la proteine IE41 d' Arabidopsis fusionnee a la GFP . 
Un protocole similaire est utilise pour les autres 
10 constructions : 

*La sequence codant pour la proteine IE41 
d' Arabidopsis depourvue des 31 premiers acides amines est 
obtenue par amplification PCR en utilisant les deux amorces 
suivantes : 

15 Sall-N-ter CGGTTGTCGACATGAAGAGTAATGAGGTTTGCCTG (SEQ ID NO : 
14) 

NcoI-C-ter CAAC CCATGGA TGGCTCGACAATGATCTTC (SEQ ID NO : 13) . 

Le plasmide 35Q-A(1-31) IE41-sGFP (S65T) est 
obtenu par insertion de cette sequence dans le plasmide 35Q- 
20 sGFP(S65T) . 

*La sequence codant pour la proteine IE41 
d' Arabidopsis depourvue des 59 premiers acides amines est 
amplifiee par PCR en utilisant les deux amorces suivantes : 
SalJ-N-ter GAATG GTCGACA TGTTTCTGCCCCGCAAGTTC (SEQ ID NO : 15), 
25 et 

NcoI-C-ter CAAC CCATGGA TGGCTCGACAATGATCTTC (SEQ ID NO : 13) . 

Le plasmide 35Q-A(l-59) IE41-sGFP (S65T) est 
obtenu par insertion de cette sequence dans le plasmide 35Q- 
sGFP(S65T) . 

30 *La sequence codant pour la proteine IE41 

d' Arabidopsis depourvue des 99 premiers acides amines est 
amplifiee par PCR en utilisant les deux amorces suivantes : 
Sall-N-ter GGTTGTCGACATGCTAGGTGGAGGTGGACTTG (SEQ ID NO : 16) 
NcoI-C-ter CAAC CCATGGA TGGCTCGACAATGATCTTC (SEQ ID NO : 13) . 

35 Le plasmide 35Q-A ( 1-99) IE41-SGFP (S65T) est 

obtenu par insertion de cette sequence dans le plasmide 35Q- 
sGFP(S65T) . 
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*La sequence codant pour les acides amines 6-100 
de la proteine IE41 d' Arahidopsis est amplifiee par PCR en 
utilisant les deu>: amorces suivantes : 

XhoI-N-tar CCTCJTCGAGATGGCTGGAAAAACTCATGCAC (SEQ ID NO : 17) 
WcoI-C-ter ACCCATGGCTAGATGGCTAAGAACCGCTAC (SEQ ID NO : 18). 

L' amorce SEQ ID NO : 17 comprend un nucleotide 
supplementaire par rapport a 1' amorce SEQ ID NO : 15, ce qui 
cree un decalage de la phase de lecture dans le produit 
d' amplification, dont la traduction debute au niveau du codon 
ATG correspondant a la methionine en position 6 de la 
proteine IE41. 

Le plasmide 35Q- (6-100) IE41-sGFP (S65T) est 
obtenu par insertion de cette sequence dans le plasmide 35Q- 
sGFP (S65T) . 

*La sequence codant pour les acides amines 60-100 
de la proteine IE41 d' Arabidopsls est amplifiee par PCR en 
utilisant les deux amorces suivantes : 

Sall-N-ter GAATGGTCGACATGTTTCTGCCCCGCAAGTTC (SEQ ID NO : 15) 
NcoI-C—ter ACCCATGGCTAGATGGCTAAGAACCGCTAC (SEQ ID NO : 18). 
Le plasmide 35Q- (60-100 ) IE4 1-sGFP (S65T) est obtenu par 
insertion de cette sequence dans le plasmide 35Q-sGFP (S65T) . 

Ces differentes constructions sont representees 
sur la figure 8. 

Legende de la figure 8 : 
IE41=plasmide 35&-IE41-SGFP (S65T) 

A(1-31)IE41= plasmide 35Q-A ( 1-31) IE41-sGFP (S65T) 
A(1-59)IE41= plasmide 35fi-A(l-59) IE41-SGFP (S65T) 
A(1-99)IE41= plasmide 35Q-A ( 1-99) IE4 1-sGFP (S65T) 
(6-100) IE41= plasmide 35Q- (6-100) IE41-SGFP (S65T) 
(60-100) IE41= plasmide 35Q- (60-100) IE41-SGFP (S65T) 
Bombardement de c ellules Arabidopsls et de tabac 

Les cellules d' Arahidopsis sont cultivees a la 
lumiere pendant 3 jours dans du milieu B5 de GAMBORG (SIGMA, 
PH 5,8) complemente avec 1,5% sucrose et 1 uM ANA (acide 
naphtalene acetique) . 15 ml de suspension cellulaire 
(correspondant a environ 0,5 g) sont transferes dans des 
boites de Petri contenant le meme milieu de croissance 
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additionne de 0,8% bacto-agar, et incubes pendant 18-36 h a 
la lumiere. 

Les cellules BY2 de tabac sont cultivees pendant 
5 jours a 27 °C dans du milieu de MURASHIGE et SKOOG (milieu 
5 MS, DUCHEFA, pH 5,8) complements avec 3% sucrose, 0,2% 
KH 2 P0 4 , 0,2% myoinositol, 1 \Oi 2.4D (acide 2.4- 
dichlorophenoxyacetique) et 3 (llM thiamine. 2,5 ml de 
suspension cellulaire (correspondant a environ 0,3 g) sont 
transferees dans • des boites de Petri contenant le meme milieu 
10 de croissance additionne de 1% bacto agar et sont places a 
27 °C pendant 18-24 h. 

Les plasmides comprenant les constructions a 
tester utilises pour le bombardement tissulaire sont prepares 
en utilisant le « QIAfilter Plasmid Midi Kit » (Qiagen, 
15 Allemagne) . 

Le plasmide [35Q-sGFP (S65T) ] (GFP) et le 
plasmide [35Q-TP-sGFP (S65T) ] (TP-GFP) sont respectivement 
utilises a titre de temoin negatif et de temoin positif. 

Les plasmides (1 |ng) sont introduits dans les 

20 ' cellules en utilisant un canon a particules pneumatique (PDS- 
1000/He, BIORAD) . Les conditions de bombardement sont les 
suivantes : pression d' helium de 1 350 psi ; disques de 
rupture de 1 100 psi (BIORAD) ; distance de cible de 10 cm ; 
des microporteurs en or de 1 jxm (BIORAD) sont utilises • Apres 

25 le bombardement, les cellules sont incubees sur ces raemes 
boites de Petri pendant 18-36 h (a la lumiere pour les 
cellules d' Arabidopsis) , puis transferees sur des lames en 
verre avant la microscopie de fluorescence. 
Microscopie de fluorescence 

30 La localisation de la GFP et des peptides de 

fusion a la GFP est analysee .dans les cellules transformees 
par microscopie de fluorescence en utilisant un microscope a 
fluorescence ZEISS AXIOPLAN 2, et une camera CCD digitale 
(HAMAMATSU) . Les jeux de filtres utilises sont : jeu de 

35 filtre Zeiss 13, 488013-0000 (excitateur BP 470/20, diviseur 
de faisceau FT 493, emetteur BP 505-530), et jeu de filtre 
Zeiss 15, 488015-0000 (excitateur BP 546/12, diviseur de 
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faisceau FT 580, emetteur LP 590) pour la GFP et 1' auto- 
fluorescence des chlorophylles, respectivement . 

Dans ces conditions, la presence de la 
chlorophylle (specif iquement localisee au niveau des 
chloroplastes) et la localisation de la GFP dans la cellule 
sont visualisees par une fluorescence intense. 

Dans les cellules d' Arabidopsis transf ormees avec 
les constructions GFP, A(1-99)IE41, et (60-100) IE41 la 
fluorescence de la GFP apparait diffuse, et localisee au 
nxveau du cytosol et du noyau; aucune 'co-localisation avec la 
chlorophylle n'est observee. 

Dans les cellules d< Arabidopsis, transf ormees 
avec les constructions IE41, A(1-31)IE41, A(1-59)IE41, (6- 
100)IE41, ainsi qu' avec le temoin positif de localisation TP- 
GFP, on observe au contraire une co-localisation, au niveau 
des chloroplastes, entre la fluorescence de la GFP et 
l'autofluorescence de la chlorophylle. 

Les resultats sont similaires dans les cellules 
non chlorophylliennes BY2 de tabac : les marquages 
fluorescents observes avec les constructions IE41, A(l- 
59)IE41 et (6-100) IE41, et avec le temoin positif de 
localisation TP-GFP, correspondent a une localisation 
plastxdrale ; en revanche, les marquages fluorescents 
observes avec les constructions GFP, A(1-99)IE41, et (60- 
100)IE41 correspondent a une localisation cytosolique et 
nucleaire. 

Ces experiences montrent que l'adressage est 
egalement efficace dans les plastes non chlorophylliens . 

L' ensemble des resultats ci-dessus montre que : 

- la proteine IE41 complete fusionnee a la GFP 
est adressee dans le chloroplaste ; 

- les 59 residus localises en N-terminal ne sont 
pas essentiels a 1' import ; 

les 99 residus localises en N-terminal 
contrennent une region essentielle a 1' import ; 

- une sequence de 94 residus, correspondant aux 
acxdes amines N-terminaux 6-100 est suffisante pour catalyser 
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1' import ; les 223 residus (101-323) C-terminaux ne sont clone 
pas essentiels a 1' import. 

La sequence interne de 40 acides amines, allant des residus 

60-100, correspond au domaine essentiel a 1' import. 

5 Toutefois, ce domaine qui doit etre present pour diriger la 
proteine vers les plastes, n'est pas suffisant pour un bon 
adressage . 
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REVENDICATIONS 

1) Polypeptide d'adressage intraplastidial 
caracterise en ce qu'il comprend : 

~ un d omaine A constitue par un polypeptide 
5 presentant au moins 60% d'identite, ou au moins 65% de 
sirrularite avec l' un des polypeptides SEQ ID NO: 4 ou 
SEQ ID NO: 5 ; ~ 

et au moins un domaine choisi parmi : 
in M ~ Un domaine B situe a l'extremite N-terminale du 

10 domarne A, et constitue par un fragment de 1'un des 
polypeptides SEQ ID NO: 1 ou SEQ ID NO: 3 comprenant au moins 
les acides amines 49 a 59 dudit polypeptide, ou bien par un 
polypeptide presentant au moins 60% d'identite, ou au moins 
65% de similarite, avec ledit fragment ; 

- un domaine C situe a l'extremite C-terminale du 
domaxne A, et constitue par 'un fragment de 1'un des 
polypeptides SEQ ID NO: 1 ou SEQ ID NO: 3 comprenant au moins 
les acides amines 101 a 111 dudit polypeptide, ou bien par un 
polypeptide presentant au moins 60% d'identite, ou au moins 
65% de similarite avec ledit fragment. 

2) Polypeptide selon la revendication 1 
caracterise en ce que le domaine B est constitue par un 
fragment comprenant au moins les acides amines 39 a 59 des 
polypeptides SEQ ID NO :1 ou SEQ ID NO :3, ou bien par un 
polypeptide presentant au moins 60% d'identite, ou au moins 
65% de similarite, avec ledit fragment. 

3) Polypeptide selon l'une quelconque des 
revendications 1 ou 2, caracterise en ce que le domaine C est 
constitue par un fragment comprenant au moins leg 

30 amxnes 101 a 121 des polypeptides SEQ ID NO : 1 ou SEQ ID 
NO :3, ou bien par un polypeptide presentant au moins 60% 
d xdentxte, ou au moins 65% de similarite avec ledit 
fragment. 

„ 4) Pol yPeptide chimerique, comprenant un 

35 polypeptide d'adressage intraplastidial selon l'une 

quelconque des revendications 1 a 3 fusionne avec une 

proteine heterologue. 
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5) Polypeptide chimerique selon la revendicat ion 
4, caracterise en ce que le polypeptide d'adressage 
intraplastidial est place a 1'extremite N-terminale de la 
proteine heterologue. 

6) Utilisation d'un polypeptide d'adressage 
intraplastidial selon la revendication 1 pour 1' importation 
d'une proteine d' interet dans des plastes. 

7) Utilisation selon la revendication 6, 
caracterisee en ce que ledit polypeptide d'adressage 
intraplastidial est utilise pour 1' importation de ladite 
proteine d' interet dans des chloroplastes . 

8) Procede pour importer une proteine d' interet 
dans des plastes caracterise en ce qu' il comprend 
1' expression, dans une cellule vegetale contenant lesdits 
plastes,- d'un polypeptide chimerique resultant de la fusion 
d'un polypeptide d'adressage intraplastidial selon la 
revendication 1 avec ladite proteine d' interet. 

9) Polynucleotide codant pour un polypeptide 
selon une quelconque des revendications 1 a 5. 

10) Cassette d' expression comprenant un 
polynucleotide selon la revendication 9 place sous controle 
de sequences de regulation de la transcription. 

11) Vecteur recombinant resultant de 1' insertion 
d'un polynucleotide selon la revendication 9 ou d' une 
cassette d' expression selon la revendication 10, dans un 
vecteur-hote. 

12) Plante transgenique transformer par un 
polynucleotide selon la revendication 9 ou d'une cassette 
d' expression selon la revendication 10. 
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gatttcgtgaaaggcttgggtgccgatgaggttcttgactacaaaacacctgaaggggcg 728 

D F V P^^SKM^^^S^Sf 212 

tccttgacaagcccgtcaggaaagaaatatgactacgtagtccacggtgcaagcggaatc 788 

WMM^&^M^^M KYDYVVHGASGI 232 

ccttggtccacctttgagcccaatttgagtgaagcaggtaaggtaatagatttgactcct 84 8 

P WSTFEPNLSEAGKVIDLTP 252 

ggcccaactgcaatgatgacatttgcttggaaaaagctaacattctccaaaaagcagctg 908 

GPTAMMTFAWKKLTFSK ^38|P8 272 

gtgcctcjtgcttttgajtacca^gatccccaactttgaatatgttgtgaatttggt"a^aag 968 

^U^^^ T E7fWIIW r \ I PNFEYVVNLVK 292 

gaaaagaagcttaaaacagtcatagactctaaacatcccttgagtaaaggtgaagatgct 1028 

EKKLKTVI DS KH PLSKGEDA 312 

tggagtaggataatgggtggtcatgctacagggaagattataatcgagccttgaatagaa 1088 

WSRIMGGHATGKIIIEP* 329 

aatattgatgcagacccgctatatattgcttgaaggttacaaacttttaagtttatagta 1148 

cttgagttatactttcctagttgtaaacattcaagtatttcataatgttatactttccta 1208 

gtttcctccaaaaaaaa 1225 
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1516s7.ST25 
SEQUENCE LISTING 



<110> GENOPLANTE VALOR 

<120> PEPTIDE D 1 ADRESSAGE PLASTIDIAL 

<130> MJPbvl516/7 

<160> 18 

<170> Paten tin version 3.1 

<210> 1 

<211> 329 

<212> PRT 

<213> Arabidopsis thai i ana 

<400> 1 

Met Ala Gly Lys Leu Met His Ala Leu Gin Tyr Asn Ser Tyr Gly Gly 
x 5 10 15 

Gly Ala Ala Gly Leu Glu His Val Gin val Pro val Pro Thr Pro Lys 
^ u 25 30 

Ser Asn Glu val cys Leu Lys Leu Glu Ala Thr Ser Leu Asn Pro Val 
" 40 45 

Asp Trp Lys lie Gin Lys Gly Met lie Arg Pro Phe Leu Pro Arg Lys 

Dyj -55 60 

Phe Pro cys lie Pro Ala Thr Asp val Ala Gly Glu Val val Glu Val 

/0 75 80 

Gly ser Gly val Lys Asn Phe Lys Ala Gly Asp Lys Val val Ala Val 
85 90 95 

Leu ser His Leu Gly Gly Gly Gly Leu Ala Glu Phe Ala val Ala Thr 
xuu 105 HO 

Glu L ys Leu Thr val Lys Arg Pro Gin Glu Val Gly Ala Ala Glu Ala 
■LJ-i 120 125 
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1516S7.ST25 

A ' a A l5 Leu Pro Va1 Ala Gl y Leu Thr Ala Leu Gin Ala Leu Thr Asn 
130 135 140 

Pro Ala Gly Leu Lys Leu Asp Gly Thr Gly Lys Lys Ala Asn lie Leu 
145 150 155 160 

val Thr Ala Ala Ser Gly Gly val Gly His Tyr Ala val Gin Leu Ala 
165 170 175 

Lys Leu Ala Asn Ala His Val Thr Ala Thr Cys Gly Ala Arq Asn lie 
180 185 190 

Glu Phe val Lys Ser Leu Gly Ala Asp Glu Val Leu Asp Tyr Lys Thr 
195 200 205 

Pro Glu Gly Ala Ala Leu Lys ser Pro ser Gly Lys Lys Tyr Asp Ala 
210 215 220 

val val His Cys Ala Asn Gly lie Pro Phe Ser Val Phe Glu Pro Asn 
225 230 235 240 

Leu Ser Glu Asn Gly Lys Val lie Asp lie Thr Pro Gly Pro Asn Ala' 
245 250 255 

Met Trp Thr Tyr Ala val Lys Lys lie Thr Met Ser Lys Lys Gin Leu 
260 265 ' 270 

Val Pro Leu Leu Leu lie Pro Lys Ala Glu Asn Leu Glu phe Met val 
275 280 285 

Asn Leu val Lys Glu Gly Lys Val Lys Thr val lie Asp ser Lys His 
290 295 300 

Pro Leu ser Lys Ala Glu Asp Ala Trp Ala Lys ser lie Asp Gly His 
3 °5 310 315 320 

Ala Thr Gly Lys lie lie val Glu Pro 
325 

<210> 2 
<211> 1228 
<212> DNA 

<213> Spinacia oleracea 



<400> 2 

ccatcctaat acgactcact atagggctcg agcggccgcc cgggcaggtc aaactgtggt 60 

aagataatac agtaccatta ccatctgacg cgcaaatggc tgctaagcta atgcatgcga 120 

ttcaatattc tggctatggt ggtggaactg atgctttaaa gcatgttgaa gttgctgttc . 180 
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ctgatccaaa gtctgatgag ttattgctta aaattgaggc tgcaactttg aacccaattg 240 

attggaagat tcagaagggt gtacttcgtc ccctcttacc ccgcaagttc cctactatac 300 

ctggaactga tgttgctggg gaggtagtcc aggctggatc tgctgtaaat aggtttaaaa 360 

ctggtgacaa agtcgtggcc gtgcttagtc atgctactgg gggtgcacta gctgaatatg 420 

ccgtggcgaa ggagaacctg acagttgcta gaccaccaga agtatcagca gcagaaggtg 480 

ctgccttacc tgttgctgcc ctcacggctc accaagctct cacccagttt gccaacatca 540 

agctcgatgg aagtggtgaa aggaagaaca tattgatcac ggctgcatca gggggtgtgg 600 

gccactatgc ggtccagctg gcaaagctcg ggaacacgca tgtaacagca acatgtggag 660 

cccgcaacct agatttcgtg aaaggcttgg gtgccgatga ggttcttgac tacaaaacac 720 

ctgaaggggc gtccttgaca agcccgtcag gaaagaaata tgactacgta gtccacggtg 780 

caagcggaat cccttggtcc acctttgagc ccaatttgag tgaagcaggt aaggtaatag 840 

atttgactcc tggcccaact gcaatgatga catttgcttg gaaaaagcta acattctcca 900 

aaaagcagct ggtgcctctg cttttgatac caaagatccc caactttgaa tatgttgtga 960 

atttggtaaa ggaaaagaag cttaaaacag tcatagactc taaacatccc ttgagtaaag 1020 

gtgaagatgc ttggagtagg ataatgggtg gtcatgctac agggaagatt ataatcgagc 1080 

cttgaataga aaatattgat gcagacccgc tatatattgc ttgaaggtta caaactttta 1140 

agtttatagt acttgagtta tactttccta gttgtaaaca ttcaagtatt tcataatgtt 1200 

atactttcct agtttcctcc aaaaaaaa 1228 

<210> 3 

<211> 329 

<212> PRT 

<213> Spinacia oleracea 

<400> 3 

Met Ala Ala Lys Leu Met His Ala lie Gin Tyr ser Gly Tyr Gly Gly 
1 5 10 15 

Gly Thr Asp Ala Leu Lys His val Glu val Ala val Pro Asp Pro Lys 
20 25 30 

ser Asp Glu Leu Leu Leu Lys lie Glu Ala Ala Thr Leu Asn Pro He 
35 40 45 

Asp Trp Lys lie Gin Lys Gly val Leu Arg Pro Leu Leu pro Arg Lys 
50 55 60 

Phe Pro Thr lie Pro Gly Thr Asp val Ala Gly Glu val val Gin Ala 
65 70 75 80 
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Gly ser Ala Val Asn Arg phe Lys Thr Gly Asp Lys Val Val Ala Val 
85 90 95 

Leu Ser His Ala Thr Gly Gly Ala Leu Ala Glu Tyr Ala val Ala Lys 
100 105 110 

Glu Asn Leu Thr val Ala Arg Pro Pro Glu val Ser Ala Ala Glu Gly 
115 120 125 

Ala Ala Leu Pro Val Ala Ala Leu Thr Ala His Gin Ala Leu Thr Gin 
130 135 140 

Phe Ala Asn lie Lys Leu Asp Gly ser Gly Glu Arg Lys Asn lie Leu 
145 150 155 160 

lie Thr Ala Ala Ser Gly Gly val Gly His Tyr Ala val Gin Leu Ala 
165 170 175 

Lys Leu Gly Asn Thr His val Thr Ala Thr cys Gly Ala Arg Asn Leu 
180 185 190 

Asp Phe val Lys Gly Leu Gly Ala Asp Glu val Leu Asp Tyr Lys Thr 
195 200 205 

Pro Glu Gly Ala Ser Leu Thr Ser Pro ser Gly Lys Lys Tyr Asp Tyr 
210 215 220 

val val His Gly Ala Ser Gly lie Pro Trp ser Thr Phe Glu Pro Asn 
225 230 235 240 

Leu Ser Glu Ala Gly Lys Val lie Asp Leu Thr Pro Gly pro Thr Ala 
245 250 ■ 255 

Met Met Thr Phe Ala Trp Lys Lys Leu Thr phe Ser Lys Lys Gin Leu 
260 265 270 

Val Pro Leu Leu Leu lie pro Lys lie Pro Asn Phe Glu Tyr val Val 
275 280 285 

Asn Leu val Lys Glu Lys Lys Leu Lys Thr val lie Asp Ser Lys His 
290 295 300 

Pro Leu Ser Lys Gly Glu Asp Ala Trp Ser Arg He Met Gly Gly His 
305 310 315 320 

Ala Thr Gly Lys lie lie lie Glu Pro 
325 

<210> 4 
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<211> 41 
<212> PRT 

<213> Arabidopsis thai i ana 
<400> 4 

Phe Leu Pro Arg Lys Phe Pro Cys lie Pro Ala Thr Asp Val Ala Gly 
1 5 10 15 

Glu val val Glu val Gly Ser Gly val Lys Asn Phe Lys Ala Gly Asp 
20 25 30 

Lys val val Ala val Leu ser His Leu 



<210> 5 
<211> 41 
<212> PRT 

<213> Spinacia oleracea 
<400> 5 

Leu Leu Pro Arg Lys Phe Pro Thr lie Pro Gly Thr Asp Val Ala Gly 
15 10 15 

Glu Val val Gin Ala Gly ser Ala val Asn Arg Phe Lys Thr Gly Asp 
20 25 30 

Lys val Val Ala val Leu Ser His Ala 
35 40 

<210> 6 
<211> 327 
<212> PRT 

<213> Escherichia coli 
<400> 6 

Met Ala Thr Arg He Glu Phe His Lys His Gly Gly Pro Glu val Leu 
15 10 15 

Gin Ala val Glu Phe Thr Pro Ala Asp Pro Ala Glu Asn Glu lie Gin 
20 25 30 

val Glu Asn Lys Ala lie Gly He Asn Phe lie Asp Thr Tyr lie Arg 
35 40 45 
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Ser Gly Leu Tyr Pro Pro Pro ser Leu Pro Ser Gly Leu Gly Thr Glu 
50 55 60 

Ala Ala Gly lie val ser Lys val Gly ser Gly val Lys His He Lys 
65 70 75 80 

Ala Gly Asp Arg val val Tyr Ala Gin Ser Ala Leu Gly Ala Tyr ser 
85 90 95 

Ser val His Asn lie lie Ala Asp Lys Ala Ala lie Leu Pro Ala Ala 
100 105 110 

He ser Phe Glu Gin Ala Ala Ala ser Phe Leu Lys Gly Leu Thr val 
115 120 125 

Tyr Tyr Leu Leu Arg Lys Thr Tyr Glu lie Lys Pro Asp Glu Gin Phe 
130 135 140 

Leu Phe His Ala Ala Ala Gly Gly val Gly Leu lie Ala cys Gin Trp 
145 150 155 160 

Ala Lys Ala Leu Gly Ala Lys Leu lie Gly Thr val Gly Thr Ala Gin 
165 170 175 

Lys Ala Gin ser Ala Leu Lys Ala Gly Ala Trp Gin val lie Asn Tyr 
180 185 190 

Arg Glu Glu Asp Leu val Glu Arg Leu Lys Glu He Thr Gly Gly Lys 
195 200 205 

LyS 210 AfQ 215 Gly 220 Gl " 

Ser Leu Asp Cys Leu Gin Arg Arg Gly Leu Met Val Ser Phe Gly Asn 
225 230 235 240 

ser ser Gly Ala Val Thr Gly val Asn Leu Gly lie Leu Asn Gin Lys 
245 250 255 

Gly ser Leu Tyr val Thr Arg Pro Ser Leu Gin Gly Tyr lie Thr Thr 
260 265 270 

Arg Glu Glu Leu Thr Glu Ala Ser Asn Glu Leu Phe Ser Leu lie Ala 
275 280 285 

Ser Gly val lie Lys val Asp val Ala Glu Gin Gin Lys Tyr Pro Leu 
290 295 300 

Lys Asp Ala Gin Arg Ala His Glu He Leu Glu ser Arg Ala Thr Gin 
3 °5 310 315 320 
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Gly Ser Ser Leu Leu lie Pro 
325 



<210> 7 

<211> 334 

<212> PRT 

<213> saccharomyces cerevisiae 



<400> 7 

Met Lys cys Thr He Pro Glu Gin Gin Lys val lie Leu lie Asp Glu 
15 10 15 



lie Gly Gly Tyr Asp val lie Lys Tyr Glu Asp Tyr Pro val Pro Ser 
20 25 30 



lie ser Glu Glu Glu Leu Leu lie Lys Asn Lys Tyr Thr Gly val Asn 
35 40 45 



Tyr lie Glu Ser Tyr Phe Arg Lys Gly lie Tyr Pro Cys Glu Lys Pro 
50 55 60 



Tyr Val Leu Gly Arg Glu Ala Ser Gly Thr Val val Ala Lys Gly Lys 
65 ' 70 75 80 



Gly val Thr Asn Phe Glu Val Gly Asp Gin Val Ala Tyr He Ser Asn 
85 90 95 



ser Thr Phe Ala Gin Tyr Ser Lys lie Ser ser Gin Gly Pro val Met 
100 105 110 



Lys Leu Pro Lys Gly Thr ser Asp Glu Glu Leu Lys Leu Tyr Ala Ala 
115 120 125 



Gly Leu Leu Gin Val Leu Thr Ala Leu Ser Phe Thr Asn Glu Ala Tyr 
130 135 140 



His val Lys Lys Gly Asp Tyr val Leu Leu Phe Ala Ala Ala Gly Gly 
145 150 155 160 



val Gly Leu lie Leu Asn Gin Leu Leu Lys Met Lys Gly Ala His Thr 
165 170 175 



lie Ala val Ala Ser Thr Asp Glu Lys Leu Lys He Ala Lys Glu Tyr 
180 185 190 



Gly Ala Glu Tyr Leu lie Asn Ala Ser Lys Glu Asp lie Leu Arg Gin 



195 



200 



205 
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val Leu Lys Phe Thr Asn Gly Lys Gly val Asp Ala Ser Phe Asp Ser 
210 . 215 220 



val Gly Lys Asp Thr Phe Glu lie Ser Leu Ala Ala Leu Lys Arg Lys 
225 230 235 240 



Gly val Phe val ser Phe Gly Asn Ala ser Gly Leu lie Pro Pro Phe 
245 250 255 



Ser lie Thr Arg Leu ser Pro Lys Asn lie Thr Leu val Arg Pro Gin 
260 265 270 



Leu Tyr Gly Tyr lie Ala Asp Pro Glu Glu Trp Lys Tyr Tyr Ser Asp 
275 280 285 



Glu Phe Phe Gly Leu val Asn ser Lys Lys Leu Asn lie Lys lie 
290 295 300 



Lys Thr Tyr Pro Leu Arg Asp Tyr Arg Thr Ala Ala Ala Asp lie Glu 
305 310 315 320 



Ser Arg Lys Thr Val Gly Lys Leu Val Leu Glu lie Pro Gin 
325 330 



<210> 8 

<211> 329 

<212> PRT 

<213> Cavia porcellus 



<400> 8 

Met Ala Thr Gly Gin Lys Leu Met Arg Ala lie Arg Val Phe Glu Phe 
1 5 10 15 



Gly Gly pro Glu val Leu Lys Val Gin Ser Asp Val Ala val Pro lie 
20 25 30 



Pro Lys Asp His Gin Val Leu lie Lys Val His Ala cys Gly He Asn 
35 40 45 



Pro val Glu Thr Tyr lie Arg ser Gly Thr Tyr Thr Arg lie Pro Leu 
50 55 60 



Leu Pro Tyr Thr Pro Gly Thr Asp val Ala Gly val Val Glu Ser lie 
65 70 75 80 



Gly Asn Asp Val Ser Ala Phe Lys Lys Gly Asp Arg val Phe Thr Thr 



85 



90' 



95 
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Ser Thr lie Ser Gly Gly Tyr Ala Glu Tyr Ala Leu Ala Ser Asp His 
100 105 110 



Thr val Tyr Arg Leu Pro Glu Lys Leu Asp Phe Arg Gin Gly Ala Ala 
115 ~ 120 125 



lie Gly lie pro Tyr Phe Thr Ala cys Arg Ala Leu Phe His ser Ala 
130 135 ' 140 



Arg Ala Lys Ala Gly Glu ser Val Leu Val His Gly Ala Ser Gly Gly 
145 150 155 160 



val Gly Leu Ala Ala Cys Gin lie Ala Arg Ala Tyr Gly Leu Lys val 
165 170 175 



Leu Gly Thr Ala Gly Thr Glu Glu Gly Gin Lys Val Val Leu Gin Asn 
180 185 190 



Gly Ala His Glu val Phe Asn His Arg Asp Ala His Tyr lie Asp Glu 
195 200 205 



lie Lys Lys Ser lie Gly Glu Lys Gly val Asp Val lie lie Glu Met 
210 215 220 



Leu Ala Asn Val Asn Leu Ser Asn Asp Leu Lys Leu Leu Ser Cys Gly 
225 230 235 240 



Gly Arg val lie lie val Gly cys Arg Gly Ser lie Glu lie Asn Pro 
245 250 255 



Arg Asp Thr Met Ala Lys Glu Ser Thr lie Ser Gly Val Ser Leu Phe 
260 265 270 



Ser Ser Thr Lys Glu Glu Phe Gin Gin Phe Ala Ser Thr lie Gin Ala 
275 280 285 



Gly Met Glu Leu Gly Trp val Lys Pro val lie Gly ser Gin Tyr Pro 
290 295 300 



Leu Glu Lys Ala Ser Gin Ala His Glu Asn lie lie His Ser Ser Gly 
305 310 315 320 



Thr val Gly Lys Thr val Leu Leu Met 



325 



<210> 9 



<211> 331 



<212> PRT 
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<213> Mus musculus 



<400> 9 ' 

Met Ala Thr Gly Gin Lys Leu Met Arg Ala lie Arg val Phe Glu Phe 
15 10 15 

Gly Gly Pro Glu val Leu Lys Leu Gin Ser Asp val val val Pro val 
20 25 30 

Pro Gin ser His Gin Val Leu He Lys val His Ala cys Gly val Asn 
35 40 45 

Pro Val Glu Thr Tyr lie Arg ser Gly Ala Tyr Ser Arg Lys Pro Ala 
50 55 60 

Leu Pro Tyr Thr Pro Gly ser Asp Val Ala Gly lie lie Glu ser Val 
65 70 75 80 

Gly Asp Lys val Ser Ala Phe Lys Lys Gly Asp Arg Val Phe Cys Tyr 
85 90 95 

ser Thr Val ser Gly Gly Tyr Ala Glu Phe Ala Leu Ala Ala Asp Asp 
100 105 110 

Thr He Tyr Pro Leu pro Glu Thr Leu Asn Phe Arg Gin Gly Ala Ala 
115 120 125 

Leu Gly lie Pro Tyr Phe Thr Ala Cys Arg Ala Leu Phe His ser Ala 
130 135 140 

Arg Ala Arg Ala Gly Glu Ser Val Leu Val His Gly Ala Ser Gly Gly 
145 150 155 160 

val Gly Leu Ala Thr cys Gin lie Ala Arg Ala His Gly Leu Lys Val 
165 170 175 

Leu Gly Thr Ala Gly ser Glu Glu Gly Lys Lys Leu val Leu Gin Asn 
180 185 190 

Gly Ala His Glu Val Phe Asn His Lys Glu Ala Asn Tyr lie Asp Lys 
195 200 205 

lie Lys Met Ser val Gly Asp Lys Asp Lys Gly val Asp val lie lie 
210 215 220 

Glu Met Leu Ala Asn Glu Asn Leu ser Asn Asp Leu Lys Leu Leu ser 
225 230 235 240 

His Gly Gly Arg val Val Val Val Gly cys Arg Gly Pro lie Glu lie 
245 250 255 
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Asn Pro Arg Asp Thr Met Ala Lys Glu Thr Ser lie He Gly val Ser 
260 265 270 

Leu ser ser ser Thr Lys Glu Glu Phe Gin Gin Phe Ala Gly Leu Leu 
275 280 285 

Gin Ala Gly lie Glu Lys Gly Trp Val Lys Pro val lie Gly ser Glu 
290 295 300 

Tyr Pro Leu Glu Lys Ala Ala Gin Ala His Glu Asp He lie His Gly 
305 310 315 320 

Ser Gly Lys Thr Gly Lys Met lie Leu Leu Leu 
325 330 

<210> 10 
<211> 28 
<212> DNA 

<213> Artificial sequence 



<220> 

<223> Description de la sequence artificielle: amorce 

<400> 10 

tcacatatgg ctggaaaact caatgcac 28 

<210> 11 

<211> 27 

<212> DNA 

<213> Artificial Sequence 



<220> 

<223> Description de la sequence artificielle: amorce 

<400> 11 

atggatccaa cgctcttatg gctcgac 27 

<210> 12 

<211> 30 

<212> DNA 

<213> Artificial Sequence 
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<220> 

<223> Description de la sequence artificielle: amorce 
<400> 12- 

cctctcgaga tggctggaaa actcatgcac 30 

<210> 13 

<211> 30 

<212> DNA 

<213> Artificial sequence 



<220> 

<223> Description de la sequence artificielle: amorce 
<400> 13 

caacccatgg atggctcgac aatgatcttc 30 

<210> 14 

<211> 35 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> Description de la sequence artificielle: amorce 

<400> 14 

cggttgtcga catgaagagt aatgaggttt gcctg 35 

<210> 15 

<211> 32 

<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description de la sequence artificielle: amorce 

<400> 15 

gaatggtcga catgtttctg ccccgcaagt tc 32 

<210> 16 
<211> 32 
<212> DNA 
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<213> Artificial Sequence 



<220> 

<223> Description de la sequence artificielle: amorce 

<400> 16 

ggttgtcgac atgctaggtg gaggtggact tg 32 

<210> 17 

<211> 31 

<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Description de la sequence artificielle: amorce 

<400> 17 

cctctcgaga tggctggaaa aactcatgca c 31 

<210> 18 

<2U> 30 

<212> DNA 

<213> Artificial sequence 
<220> 

<223> Description de la sequence artificielle: amorce 

<400> 18 

acccatggct agatggctaa gaaccgctac 30 
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•INPI. 




mcrnuT 

MATIO.'UL OB 
LA FftOPBICTB 
in D U fcTfl I E LLS 



DEPARTEMENT DES BREVETS 

26 bis, rue de Saint Petersbourg 
75800 Paris Cedex 08 

Telephone : 33 (1) 53 04 53 04 Telecopie : 33 <1) 42 94 86 54 



CERTSF8CAT D'UTIUTE 

Code de ia propri&e intellectuelle - Uvre VI 

DESI6NAT1©W D'INVENTEUR(S) Page N°?../3, 

(A fournir dans le cas ou les demandeurs et 

les inventeurs ne sont pas les memes personnes) 




h1> 



Vos references pour ce dossier (facultatij) 


MJPbv1516/7FR 


W° D'ENREGISTREWIENT MAT10IML 


02 07729 



T1TOE DE [.'INVENTION (200 caracteres ou espaces maximum) 
PEPTIDE D'ADRESSAGE PLASTID1AL 



LE(S) DEM A i\3 PEU R(S) : 

GENOPLANTE-VALOR 
93, rue Henri Rochefort 
91025 EVRY CEDEX 



DESiGME(NT) EW TAWT QU'ISWENTEUR(S) : 



D Norn 


GRUNWALD 


Prenoms 




Didier 


Adresse 


Rue 


3 rue des Brieux 




Code postal et ville 


13 1 8 1 1 ,2 10 I SAINT-EGREVE 


Soctete d'appartenance (facultatij) 




M Nom 




Prenoms 






Adresse 


Rue 






Code postal et ville 


1 I i 1 1 1 


Soctete d'appartenance (facultatij) 








Prenoms 






Adresse 


Rue 






Code postal et ville 


1 i i i i ! 


Soctete d'appartenance (facultatif) 





S'il y a plus de trois inventeurs, utilisez plusieurs formutaires. Indiquez en haut a droite le N° de la page suivl du nombre de 



DATE ET SIGNATURE(S) 
DU (DES) DEMANDEUR(S) 
OU DU MANDATAIRE 
(Worn et qualrte du signatalre) 

Paris, le 13 juin 2003 

VIALLE-PRESLES Marie Jose 
(n° 93-2009) 

La loi n°78-17 du 6 janvier 1978 relative a I'tnformatique, aux fichiers et aux libertes s'applique aux reponses faites a ce formulaire. 
Elle garantit un droit d'accfes et de rectification pour les donnees vous concernant auprfes de 1'INPL 
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